Ce document vise à étudier les inégalités entre hommes et femmes à travers le monde. Les données portent sur 188 pays et comparent les genres selon trois axes : la santé, l’autonomie, et leur présence sur le marché du travail.
Dans les colonnes du jeu de données, on a donc les informations suivantes :
Le schéma suivant décrit l’association de ces différents paramètres dans la création du GII.
image extraite du site www.kaggle.com
Les graphiques ci-dessous présentent le classement des pays par GII. Nous avons choisi d’utiliser des lollipop plot étant dans un cas où nous représentons des données numériques (GII) par rapport à des données catégoriques (nom des pays), ce qui nous a dirigé vers un barplot. Pour parer au cas de nombreuses valeurs similaires qui rendraient ce graphique illisible, nous avons opté pour un lollipop plot. Par souci de lisibilité, nous avons de plus décidé de ne pas tout afficher à la fois mais de présenter d’abord les 15 pays au niveau d’inégalité le plus bas (GII le plus faible) avant de passer aux 15 les plus inégalitaires et enfin de donner une vue d’ensemble par région du monde.
p1 = data %>% # Elimination des pays dont on n'a pas le GII
filter(Gender.Inequality.Index..GII. != "..") %>% # Elimination des donnees continent et monde
filter(!is.na(GII.Rank)) %>% # Definition du texte qui apparait quand on passe la souris sur un point
mutate(myText = paste(Gender.Inequality.Index..GII.)) %>% # Classement des pays par ordre decroissant de GII
arrange(desc(Gender.Inequality.Index..GII.)) %>% mutate(Country = factor(Country,
Country)) %>% # Conservation des 15 derniers pays de la liste classee (les 15 pays au GII
# le plus faible)
tail(15) %>% # Affichage
ggplot(aes(x = Country, y = Gender.Inequality.Index..GII., text = myText)) +
geom_segment(aes(x = Country, xend = Country, y = 0, yend = Gender.Inequality.Index..GII.),
color = "grey") + geom_point(size = 3, color = "#7baeff") + # inversion des coordonnees
coord_flip() + theme(panel.grid.minor.y = element_blank(), panel.grid.major.y = element_blank()) +
# definition des noms des axes et du titre
xlab("") + ylab("GII") + ggtitle("Gender Inequality Index : Top 15 Countries")
# Affichage interactif du graph
ggplotly(p1, tooltip = "text")p2 = data %>% filter(Gender.Inequality.Index..GII. != "..") %>% filter(!is.na(GII.Rank)) %>%
arrange(desc(Gender.Inequality.Index..GII.)) %>% mutate(myText = paste(Gender.Inequality.Index..GII.)) %>%
mutate(Country = factor(Country, Country)) %>% head(15) %>% ggplot(aes(x = Country,
y = Gender.Inequality.Index..GII., text = myText)) + geom_segment(aes(x = Country,
xend = Country, y = 0.55, yend = Gender.Inequality.Index..GII.), color = "grey") +
geom_point(size = 3, color = "#d071ff") + coord_flip() + theme(panel.grid.minor.y = element_blank(),
panel.grid.major.y = element_blank()) + xlab("") + ylab("GII") + ggtitle("Gender Inequality Index : Bottom 15 Countries")
ggplotly(p2, tooltip = "text")data %>% filter(Gender.Inequality.Index..GII. != "..") %>% # Selection des donnees 'zones geographiques'
filter(is.na(GII.Rank)) %>% filter(Country != "World") %>% # Classement par ordre croissant
arrange(desc(Gender.Inequality.Index..GII.)) %>% mutate(Country = factor(Country,
Country)) %>% # Affichage
ggplot(aes(x = Country, y = Gender.Inequality.Index..GII.)) + geom_segment(aes(x = Country,
xend = Country, y = 0, yend = Gender.Inequality.Index..GII.), color = "grey") +
geom_point(size = 3, color = "#ffb57b") + coord_flip() + theme(panel.grid.minor.y = element_blank(),
panel.grid.major.y = element_blank()) + xlab("") + ylab("Medium GII") +
ggtitle("Gender Inequality Index : Continent indexes") + # Annotations de lignes verticales (GII mondial, GII extremes..)
geom_hline(yintercept = 0.449, color = "#7baeff", size = 1) + annotate("text",
x = 3.5, y = 0.5, label = "World GII", color = "#7baeff", size = 3, angle = 0,
fontface = "bold") + geom_hline(yintercept = 0.016, color = "#2ec212", size = 1) +
annotate("text", x = 3.5, y = 0.08, label = "Lowest GII\nSlovenia", color = "#2ec212",
size = 3, angle = 0, fontface = "bold") + geom_hline(yintercept = 0.744,
color = "#da7855", size = 1) + annotate("text", x = 3.5, y = 0.68, label = "Highest GII\nYemen",
color = "#da7855", size = 3, angle = 0, fontface = "bold")
Dans ce dernier graphe, nous avons affiché un classement plus général, par zones géographiques. Pour observer l’échelle de ces indices par rapport aux deux premiers graphiques, nous avons affiché les GII extrêmes (0.016 pour la Slovénie et 0.744 pour le Yemen) ainsi que la moyenne mondiale (de 0.449). On observe comme attendu une opposition entre pays dits “du Nord”, aux indices les plus faibles et ceux dits “du Sud”.
Tout d’abord nous avons voulu observer les différences d’accès à l’éducation selon le genre. Pour ce graphique et le suivant, nous avons opté pour un scatterplot (dans la mesure où nous travaillons sur des données numériques que nous croisons) et placé une droite représentant un accès égal à l’éducation pour les genres, pour pouvoir observer l’écart présent dans chaque pays.
secEd <- data %>% # Elimination des donnees monde et continents
filter(!is.na(GII.Rank)) %>% # Definition du texte affiché quand on passe sur un point (Pays)
mutate(myText = paste(Country)) %>% # Affichage
ggplot(aes(x = Population.with.Secondary.Education..Female., y = Population.with.Secondary.Education..Male. -
Population.with.Secondary.Education..Female., text = myText)) + geom_point() +
theme(panel.grid.minor.y = element_blank(), panel.grid.major.y = element_blank(),
axis.ticks = element_blank()) + xlab("Proportion of female population with secondary education") +
ylab("Difference male-female in access to secondary education") + # Annotation : droite y=0
annotate("segment", x = 0, xend = 100, y = 0, yend = 0, colour = "purple", size = 1,
alpha = 1)
# Affichage interactif
ggplotly(secEd, tooltip = "text")
Dans le graphique suivant, nous avons voulu étudier l’impact de l’accès à l’éducation secondaire sur l’“Adolescent Birth Rate” et vérifier si l’inégalité de cet accès entre hommes et femmes avait un impact sur ce résultat.
secEd2 <- data %>% # Selection des donnees 'zones geographiques'
filter(!is.na(GII.Rank)) %>% mutate(myText = paste(Country)) %>% # Affichage
ggplot(aes(x = Population.with.Secondary.Education..Female., y = Population.with.Secondary.Education..Male.,
color = Adolescent.Birth.Rate, text = myText)) + geom_point() + scale_color_viridis(option = "D") +
theme(panel.grid.minor.y = element_blank(), panel.grid.major.y = element_blank(),
axis.ticks = element_blank()) + xlab("Proportion of female population with secondary education") +
ylab("Proportion of male population with secondary education") + # annotation : droite y=x
annotate("segment", x = 0, xend = 100, y = 0, yend = 100, colour = "purple",
size = 1, alpha = 0.4)
# Affichage interactif
ggplotly(secEd2, tooltip = "text")A work by Anais HOAREAU, Sébastien MARCHAL, Rémi NAHON
anais.hoareau@mines-ales.org, sebastien.marchal@mines-ales.org, remi.nahon@mines-ales.org